Mon Roman d’appRentissage

8 années de découverte de la science des données

Kim Antunez

RLadies Paris

19 octobre 2023

À propos

Le roman d’apprentissage, ou initiatique, est un genre littéraire ayant pour thème le cheminement d’un héros, souvent jeune, qui atteint progressivement l’idéal de l’humain accompli, faisant l’expérience des grands événements de l’existence : l’amour, l’altérité, la frustration, etc.

L’histoire que je vais vous conter est la mienne : les huit années passées à me former progressivement à la science des données : l’amour de R, son altérité = sa communauté, la frustration de ne pas voir tout le monde s’émerveiller face à l’évolution des logiciels statistiques, pourtant si excitante.

Je vous décrirai les déclics issus de mes projets professionnels et personnels, et comment ils ont fait évoluer le regard que j’ai sur mon métier et ses outils :

  • des packages… autour du lissage spatial et de l’évolution de la géographie communale.
  • des formations… à l’analyse spatiale, à la cartographie, d’introduction à R.
  • des applications shiny… de visualisation de données d’enquêtes, de simulations de parties de mastermind, d’invitation à un mariage.
  • et, avant tout, des rencontres ! Hâte de faire la vôtre !

Qui suis-je ?

Investie depuis 8 ans dans le logiciel R et sa communauté, je m’intéresse en particulier à l’analyse spatiale, à la datavisualisation et plus largement aux méthodes quantitatives appliquées aux sciences sociales.

Convaincue par l’open-data, l’open-source, et l’automatisation de processus statistiques utiles à différents types d’acteurs, j’ai réalisé des projets en ce sens, tant professionnels que personnels.

Avant tout une RLady

Au sens littéral : une femme qui utilise R

  • Pour mon travail
  • En passe-temps
    • Par plaisir d’apprendre à coder
    • Parce que coder permet de produire
    • Parce que coder permet d’exercer son esprit créatif

Une statisticienne publique

  • Formée en statistiques / data science, économie, sciences sociales et informatique
    • à l’ENSAI (2012 - 2015)
    • à l’ENSAE (2019 - 2021)
  • Travaillant (actuellement) dans le secteur public
    • Depuis 2021: Institut national de la statistique et des études économiques (Insee)
    • 2017-2019 : Service Statistique du Ministère des Solidarités et de la Santé (Drees)
    • 2015-2017 : Agence nationale de la cohésion des territoires (ANCT, CGET à l’époque)

Mon parcours année par année

2015

Image créée avec DALL-E 3

Rédaction de ma première étude statistique

Paris-Lyon-Marseille dans les codes Insee des communes : quand j’ai découvert que les coquilles sont systématiques et quasi-inévitables

  • Trouver des moyens de les éviter ?
    • Travail à plusieurs (dans l’idéal oui, en pratique rarement)
    • Reproductibilité (mise en place plusieurs années plus tard)
    • (Faire) comprendre qu’une coquille n’est pas une faute professionnelle

Rencontre avec un passionné de l’open-data

Aimer partager

  • partager des données (Open Data)
  • partager son code (Open Source)
  • partager ses compétences (papotter, alimenter une communauté)

2016

Image créée avec DALL-E 3

Création de mon site web

  • D’abord blog jekyll (jekyll-now) avec deux répertoires distincts et utilisation des github pages (800 commits dont une 50aine les 24 et 25/12)
  • Puis avec Hugo interfacé avec blogdown (cc @rlesur)
  • Je n’ai pas encore eu le courage de le passer en quarto et en intégration continue celui-là…

=> Innover c’est bien… Mais ça fatigue parfois de devoir se réinventer régulièrement.

2017

Image créée avec DALL-E 3

Rédaction de mon premier package

2018

Image créée avec DALL-E 3

Premiers talks en public

  • RLadies à Paris en mars
  • Rencontres R à Rennes en juillet
  • Ecole d’été en septembre à Florence (cc @comeetie et @rgeomatic)
    • Date à partir de laquelle j’ai décidé de dire adieu à l’auto-censure

Rencontre avec la communauté R

2019

Image créée avec DALL-E 3

shiny

  • Gare aux perfectionnistes : savoir dire stop ! (on peut améliorer le rendu et l’ergonomie à l’infini)
  • Pas si simple à maintenir, et encore moins simple pour des passations vers des personnes qui n’ont pas le même bagage technique.

Retour sur les bancs de l’école

Encore plus de codes :

2020

Image créée avec DALL-E 3

A la fois étudiante et enseignante

  • Université de Lille à distance (Covid)
  • Cours/TD d’introduction aux méthodes quantitatives avec R à des L3 en sciences politiques

2021

Image créée avec DALL-E 3

Préparation d’un heureux événement

  • Quand les compétences professionnelles s’invitent dans la vie privée.
  • inspiration : ThinkR-open/wedding

En route vers Python

  • Chargée de TD Python à l’ENSAE
  • site du professeur entièrement reproductible, source d’inspiration.

2022

Image créée avec DALL-E 3

Le spatial, ça vous gagne

  • Analyse urbaine à l’Insee avec une petite équipe
    • arbitrage innovation versus temps + maintenabilité
  • Formations de cartographie et d’analyse spatiale en interne, et ailleurs (Tuto RR2023)
  • maintenance du package R btb, formations, logo !

L’intégration continue

  • Un pas de plus vers la reproductibilité

2023

Image créée avec DALL-E 3

Introduction à la datascience avec R

  • quarto et ses listings
  • github pages
  • intégration continue

Et vous ?

Quelle est votre histoire avec R ?